表格内容识别(python-opencv)(一)【9/8】

暑假都在弄这个,一开始以为是要弄一个通用的对表格进行分块和把内容全部识别,所以又分块又分行又把横线上的内容单独弄出来,后来说是对于已知的特定表格,所以最后都用python来写了,比较方便。在网上只找到一个比较巧妙的提取表格框架的方法,用横向和竖向的细长的条去腐蚀膨胀可以得到横线和竖线,拼在一起就是完整的表格框架,而且这样正好把一些小点和文字去除了。

 这样的话因为有些线太细,就检测所有轮廓再加粗一次,上图为加粗后的表格框架和找到的表格块(这图有点问题。。。好的找不到了)。但这个方法有个问题就是表格位置必须比较正,如果倾斜角度较大则不行。所以要先对表格进行透视变换后摆正。这里使用的方法是用上图找到的表格框架,找到表格的四个顶点,再和其轮廓的外接矩形的四个顶点得到变换矩阵。这里还有个问题,就四个顶点和变换后的四个顶点必须是对应的,所以要对四个顶点进行排序,怎么对矩形的四个顶点进行排序,在网上也找到了一个比较好的方法,就是将得到的四个顶点先按照y坐标分成上下A、B两部分,再对A部分按x坐标从小到大排序,对B部分按x坐标降序排序,这样四个点就能按照顺时针排列了,对于没有定位标识的表格,只要表格不是倒着摆放或者过分倾斜都可以正确变换。然后还有一个问题就是这是用外接矩形作为变换后

  • 8
    点赞
  • 60
    收藏
    觉得还不错? 一键收藏
  • 14
    评论
要实现这个任务,需要使用Python中的OpenCV和Pandas库。具体步骤如下: 1. 首先,使用OpenCV读取图片,将其转换为灰度图像并进行阈值处理,以便于检测表格线。 ```python import cv2 import numpy as np # 读取图片并转换为灰度图像 img = cv2.imread('image.png') gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 应用阈值处理,以便于检测表格线 thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1] ``` 2. 检测表格线。我们可以使用HoughLinesP函数来检测直线,然后筛选出水平和垂直线。 ```python # 检测表格线 horizontal_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (25, 1)) vertical_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (1, 25)) horizontal_lines = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, horizontal_kernel) vertical_lines = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, vertical_kernel) # 筛选出水平和垂直线 lines = cv2.HoughLinesP(horizontal_lines + vertical_lines, 1, np.pi/180, 100, minLineLength=100, maxLineGap=10) ``` 3. 将检测到的表格线画出来,并将表格线的坐标存储在列表中。 ```python # 画出检测到的表格线 for line in lines: x1, y1, x2, y2 = line[0] cv2.line(img, (x1, y1), (x2, y2), (0, 255, 0), 2) # 存储表格线的坐标 horizontal_points = [] vertical_points = [] for line in lines: x1, y1, x2, y2 = line[0] if abs(x1 - x2) < 10: vertical_points.append((x1, y1)) elif abs(y1 - y2) < 10: horizontal_points.append((x1, y1)) ``` 4. 根据表格线的坐标,将表格分割成单元格。 ```python # 对表格线的坐标进行排序 horizontal_points = sorted(horizontal_points, key=lambda x: x[1]) vertical_points = sorted(vertical_points, key=lambda x: x[0]) # 将表格分割成单元格 cells = [] for i in range(len(horizontal_points) - 1): for j in range(len(vertical_points) - 1): x1, y1 = vertical_points[j] x2, y2 = vertical_points[j+1] x3, y3 = horizontal_points[i] x4, y4 = horizontal_points[i+1] cell = img[y3:y4, x1:x2] cells.append(cell) ``` 5. 使用Pandas库将单元格数据转换为Excel文件。 ```python import pandas as pd # 将单元格数据转换为DataFrame data = [] for cell in cells: gray_cell = cv2.cvtColor(cell, cv2.COLOR_BGR2GRAY) text = pytesseract.image_to_string(gray_cell, lang='eng', config='--psm 6') data.append(text.strip()) df = pd.DataFrame(np.array(data).reshape(len(horizontal_points) - 1, len(vertical_points) - 1)) # 将DataFrame写入Excel文件 df.to_excel('table.xlsx', index=False, header=False) ``` 完整代码如下:

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值